
Rahim Rahmani (rahim@dsv.su.se) 

Division of ACT 

Department of Computer and Systems Sciences 
Stockholm University 


SVAR TILL TENTAMEN I DATORSYSTEM, VT2013 


Tentamensdatum: 2013-03-21 

Tentamen består av totalt 16 uppgifter. Del A består av 11 uppgifter och 
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Tillåtna hjälpmedel: Inga 

Skrivhänvisningar: - Skriv läsbart och tydligt för att undvika feltolkningar. 

Motivera dina Svar, ev. tabeller och beräkningar som 
används för att nå svaret ska också finns i lösning. 
Ofullständigt motiverade svar kan INTE ge poäng 


LYCKA TILL! 



Del A 


1. Beskriv vad innebär att ”fetch an instruction”. (lp) 

Fetch an instruction innebär att CPU hämtar en instruktion antigen i ett register eller i 
primärminnet för att sedan kunna exekvera den. 

2. Beskriva Von Neumann-modellen även förklara syftet med: (3p) 

a) Arithmetic-Logic Unit (ALU). 

b) Program Counter (PC). 

c) Control Unit (CU). 

Von Neumann-modellen för instruktion exekvering i CPU. Control Unit hämtar 
instruktion genom att få info om deras adresser register av PC. Instruktionen dekodas och 
skickas till ALU för att genomföra de aritmetiska beräkningarna. 



ALU: Är den aritmetiska och logiska enheten. Utför beräkningar av operander. 

PC: Anger nästa instruktion som ska exekveras 

CU: Hämtar instruktioner från register / Main Memory & dekodar dem. 

3. Konvertera talet 137Bi6 till decimal talbasen. (lp) 

137Bi6 => 0001 0011 0111 1011 2 
Svar: 4987io 


4. Konvertera talet 0.8125 till binära talbasen. 


(lp) 




0 . 

OO 

12 

5 

O 

1 

. 5 

00 

0 

0 . 

. 3 

12 

5 

O 

1 

. 2 

50 

0 

0 . 

. 0 

62 

5 

- 



0 

0 . 

. 0 

62 

5 

O 

1 

. 0 

62 

5 


0 


= 2 _1 X 1 
= 2“ 2 x 1 
= 2 -3 x 0 
= 2“ 4 x 1 


0.8125 io = 1/2 + 1/4 + 1/8 + 1/16 


5. Skriv sanningstabellen för AND, OR och NOT. 


dp) 


AND 

X Y X.Y 
0 0 0 

0 1 0 

1 0 0 

1 1 1 

6. Förklara: 
a) vad är 


OR 

X Y X+Y 
0 0 0 
0 1 1 
1 0 1 
1 1 1 


en ”bus cycle” ? 


NOT 

X X' 

0 1 
1 0 


(2p) 


En ”bus cycle” är tiden mellan två ”ticks” för bussklockan. ”Bus cycle” är alltså den tiden man 
har på sig att överföra data mellan CPU:n och primärminnet. 


Begreppet ”bus cycle” står i sig själv för själva mellanrummet mellan två ”tickningar” som sker 
hos en bus clock. På så sätt kan man genom en bus cycle se hur mycket tid som krävs för att 
utföra olika typer av skrivning eller läsning emellan lagringsenheten(primärminnet) och central 
Processing unit(CPU:n). Så under varje bus cycle skickas data via en bus snabbt och effektiv 
mellan dessa två enheter. 


b) skillnaderna mellan databussar, adressbussar och kontrollbussar. 


Data som skickas via bussar förekommer i olika former och hanterar olika typer av saker. Det är 
även så att bussar inte alltid är ”point-to-point” utan används även ofta av flera olika enheter. På 
grund av detta har det utvecklats specifika ”lines” som alla hanterar en viss typ av data. Det finns 
tre huvudbussar som främst förekommer vilket är; databussar, adressbussar och kontrollbussar: - 
Databussar erhåller själva datainformationen som ska skickas ifrån punkt A till punkt B. - 
Adressbussar däremot erhåller information om vart dessa punkter finns lokaliserade, vilket är 
nödvändigt för att datorn ska kunna avgöra vart data förväntas att antingen läsas/skrivas ifrån. - 
Kontrollbussar är oerhört viktiga då de avgör vilka enheter som har tillåtelse till användande av 
bussen, samt registrerar även bussanvändarens syfte till användningen av bussen. Denna buss 
behandlar även viktiga kommandon som skickas ifrån CPU:n. Den hanterar till exempel 
förfrågningar ifrån enheter, eventuella avbrott, och synkroniseringssignaler av datorns 
klocka(clock). 






7. Beskriv gränssnittet mellan CPU och I/O - Specificera delvis funktionalitet i I/O. (lp) 


Gränssnitt mellan CPU och I/O som bestämmer hur de olika enheterna kommer att 
kommunicera. Detta kan tex ske genom programmed I/O (CPU väntar på instruktioner 
från I/O ). 

interrupts driven I/O ( att Interrupts kontroller skickar interrupt signal till CPU när det 
finns instruktioner att hämta). Mer information kan hittas i föreläs. 8 bilderna 4-7. 


8. Förklara fördelar och nackdelar av två cache minnes skrivningspolicy. (2p) 

De två olika cacheminnesskrivningspolicy som finns är write back och write through. 

Write through - Den här policyn innebär att eventuella förändring av information uppdateras 
hos cacheminnet såväl som i primärminnet vart eftersom någon förändring sker. Det 
uppenbara fördelen med detta är att information ständigt blir uppdaterad hos båda enheterna 
vilket gör att den befintliga informationen i cache stämmer överens med primärminnet och gör 
att data blir ”aktuell” och riktig. Den stora nackdelen är däremot att det kräver extra tid och 
arbete för datorn att uppdatera cache såväl som primärminnet, vilket gör att systemet blir 
långsammare. 

Write back -1 denna policy uppdateras de olika blocken i primärminnet endast när block 
behöver rensas ur cacheminnet. Detta medför en nackdel som innebär att primärminnets data 
inte alltid kanske stämmer överens med den data som erhålls i cache, vilket kan resultera i ett 
förlorande av informationen om en processkrasch inträffar. Fördelen med denna 
skrivningspolicy är däremot att den är mycket snabbare än write-through-policyn då den inte 
ständigt behöver lägga ned arbete på att uppdatera minnet vid varje cache-uppdatering. 

Även se bilderna 20-22 i Föreläs. 7 

9. Vilka faktorer är avgörande för en processors prestanda? (2p) 

Den första viktiga faktorn som har en oerhört står påverkan på en dators prestanda är själva 
huvudprocessorn(CPU). Eftersom denna enhet är den enheten som utför alla program och 
operationer som inkluderar bland annat beräkning(som sker i ALU:n) och hantering av olika 
typer av data. En av de viktigaste delarna i en processor är den så kallade processorkärnan, 
som är den delen i processorn som utför själva beräkningarna av data. Därefter ju fler 
integrerade processorkärnor en processor erhåller, desto flera beräkningar kan exekveras 
parallellt, vilket därefter ökar datorns prestanda. 

En annan viktig faktor är en dators prestanda är dess klockfrekvens som mäts i MHz. En 
klocka i datorn har en så kallad huvudklocka-signal som tickar ifrån 0 till 1 och därefter 1 till 
0. Detta främst för att upprätthålla en slags synkron och se till att olika slags exekveringar sker 
i relativt synkroniserade intervaller. Sparregister måste till exempel invänta nästa ”tick” innan 
de kan ladda data. Därmed är det logiskt att ju snabbare klockfrekvens en dator har, ju 
snabbare och bättre kan den prestera. Under varje ”tick” sker olika typer av exekveringar och 
sparande, och allt måste hinnas med under samma klockslag. Dock innebär detta att klockan 
måste anpassas så att det utförandet som tar längst tid hinner att utföras, vilket är något som 
måste tas hänsyn till och blir ett hinner för att kunna sätta en allt för hög klockfrekvens. 
Arkitekturen på en dator och dess komponenter kan också vara en avgörande faktor för 
prestandan. Om enheter till exempel har kortare avstånd när det gäller kommunikation eller 
extra komponenter som påskyndar eventuell kommunikation eller exekveringar kan 
prestandan ökas avsevärt då en kortare färdväg ger snabbare exekvering och kortare 



”väntetider” hos vissa utföranden. Snabbare tillgång till minne, snabbare läsning av minne, 
snabbare kommunikation är exempel på detta som därefter bidrar till en bättre prestanda. 

10. Vad är ett distribuerade system? Beskriv de Nyckel karakteristiska för ett distribuerade 
System. (2p) 

Detta innebär att det är ett flertal parallellt arbetande delsystem som genom utbyte av 
kommunikation emellan varandra via ett datornätverk tillsammans utför en gemensam 
uppgift. I vissa fall med distribuerade system är det så att man vill underlätta en viss typ av 
bearbetning genom att fördela denna till olika enheter. Detta sker oftast i en klient-server 
relation där centrala servrarna(server-system) distribuerar ut delproblem till andra 
sammanslutna datorer(klient-system). Beräkningen av dessa problem hos klient-datorerna 
utförs med oerhört låg prioritet, och kapaciteten till beräkning används bara om datorerna inte 
används för något annat. Efter att respektive klient-dator har löst sin del av problemet så 
skickar den tillbaka resultatet till central-servern och mottar eventuellt ett nytt problem att 
lösa. Eftersom så många datorer på detta sätt kan arbeta tillsammans och snabbt samt effektiv 
lösa stora problem så blir det hela jämförbart med prestandan hos en superdator. 

11.1 början av 1970-talet hade ett företag en eller maximalt två datorer. Dessa var isolerade 
öar och det fanns ingen kommunikation mellan dem. Dessa datorer kallades ”Main 

frames” \ Fenomenet med isolerade öar återkom även senare i och med att företagen fått 

2 

fler och mindre datorer sammankopplade i nätverk . Hur kunde problemet uppstå igen? 
Ge några olika orsaker till de isolerade öarna. 



a. Vilken revolutionerande teknik kunde så småningom lösa problemet med de isolerade 

öarna i bild 2? (lp) 

Internet protokoll 

b. Beskriv denna tekniks delar. (2p) 




Med hjälp av IP och IP adressering kan information(i form av segmenter som kallas 
packet) från en enhet i ett nätverk skickas vidare via switchen som är kopplar till 
lokala nätet. Packeten sedan skickas vidare från switchen till routern. Routern är 
gateway mellan lokala nätet och Internet. Routern kommer att lista mottagares nätid 
från ip adressen och efteråt skickar vidare packeten till mottagare. 








Del B 

1. Flyttal är ett sätt att representera stora, små och rationella tal. I nedanstående uppgift 
används flyttalsstandarden IEEE 754 för 16-bitars flyttal. 

15 10 0 
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Beräkna operation A+B . Svara med ett 16-bitars flyttal enligt IEEE754. 
och A= 12io ochB= 1.25io. (3p) 


Floating-Point Representation 

• Example: 

- Find the sum of 12 10 and 1.25 10 using the 14-bit 
“simple'' flaating-point model. 

• We find 12 10 = 0.1100 x 2 4 And 1.25 10 = 0.101 X2 1 = 
0.000101 x 2 4 . 



Etockhcrfrn 
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Normaliser : 12io = 0,1100 x 2 4 

l,25i 0 = 0,101 x 2 1 = 0,000101 x 2 4 





























2. IP-nät indelas i fyra stycken adressklasser. Beskriv de fyra IP-adressklasser (bild 110 
För. 13-14) 


Classify and Define IPv4 Addresses 

• Identify the historic method for assigning addresses and 
the issues associated with the method 
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a. TCP/IP modellen inspirerade OSI-modellen till att delas upp i skikt, i själva 
verket har TCP/IP sin egen skiktning namnge vilka. 

TCP/IP Model 


Represents data to the user plus 
encoding and dialog control. 


Supports communication between diverse 
devices across diverse networks. 


Determines the best path through the network. 


Controls the hardware devices and 
media that make up the network. 


Application 


Transport 


Internet 


Network 

Access 


b. Namnge och beskriv TCP funktioner, (bilder 66-67 & 69-71, För. 13-14) 














Application and Operation of TCP 
Mechanisms 

• Tracethe steps in the handshake in the establishment of 
TCP sessions 


: TCP Connection Establishment and Term i nation 
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Managing TCP Sessions 


• Describe how TCP sequence numbers are used to 

reconstruct the data stream with segments placed in the 
correct order 
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( 4 p) 


c. Beskriv med ett exempel hur DNS-uppslagningarna (DNS-queries) utförs. 







UDP Protocol 


* Trace the steps as the UDP protocol and port numbers 
are utilized in client-server communication. 


Client Stntling UDP R&qvcris 



Client 1 waiting for 
server DNS resp^n&e 
on Port 49152 


Client 2 waltlng for aerwr 
Ra Ql u £ reapon&e 
on Port 61152 rt]m 

?Lt y 


3. Namnge och Beskriv tekniker för hantering av branches i pipelines. (2p) 

Två olika tekniker för att hantera branchar vid pipelining är ”branch prediction” och 
”delayed branch”. 

Delayed branch, man läser in branch instruktionen men eftersom den inte tar effekt på en 
gång pga. pipelinen, så kan man lägga in en annan instruktion efter branch instruktionen. 
Den instruktionen kommer då att exekveras innan branch instruktionen tar effekt. 

Branch prediction, man försöker förutsäga vilken instruktion som kommer att behövas 
härnäst, om en branch kommer att ske eller inte. Om man lyckas förutsäga branchen 
korrekt så har man inte slösat bort några processorcykler. 


4. (a) Beskriv skillnader mellan RISC och CISC processorer. 


(2p) 


RISC 

- Multiple register sets. 

- Three operands per 
instruction. 

- Parameter passing 
through register 
Windows. 

- Single-cycle 
instructions. 

- Hardwired 
control. 

- Highly pipelined. 

Continued.... 


CISC 

- Single register set. 

- One ortwo register 
operands per 
instruction. 

- Parameter passing 
through memory. 

- Multiple cycle 
instructions. 

- Microprogrammed 
control. 

- Less pipelined. 
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« RISC 

- Simple instructions, 
few in number. 

- Fixed length 
instructions. 

- Complexity in 
compiler. ' 

- Only load/store 
instructions access 
memory. 

- Few addressing 
modes. 


* CISC 

- Many complex 
instructions. 

- Variable length 
instructions. 

- Complexity in 
microcode. 

- Many instructions 
can access memory. 

- Many addressing 
modes. 
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(b) Vi har följande avsnitter ur två assemblerprogram. 


Avsnitt ur assemblerprogram 1 


mov 

ax. 

10 

mov 

bx, 

5 

mul 

bx, 

ax 


Avsnitt ur assembler program 2 _ 

mov ax, 0 
mov bx, 10 
mov cx, 5 
Begin add ax, bx 

loop Begin 


Du ska ange antal ”clock cycles” för respektive avsnitter ur assemblerprogram 
1 och 2. 


• Considerthe program fragments: 

mov ax, 10 

CISC mov bx t 5 RISC 

mnl bx f ax 


mov ax, 0 
mov bx r 10 
mov cx , 5 
Begin add ax r bx 
loop Begin 


* The total clock cycles for the CISC version might be: 

{2 movs x 1 cyclej + {1 mnl x 30 cycles) = 32 cycles 

* Whilethe clock cycles for the RISC version is: 

{3 movs x 1 cyclej + ^5 adds x 1 cyclej + {5 loops x 
1 cycle) =13 cycles 

* With RISC clock cycle being shorter, RISC gives us 
much faster execution speeds. 
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5. Ett cacheminne har plats för total 512 bytes och varje rad är 16 bytes lång. Minnet är 
direktmappat och en adress är 32 bitar lång. Förutsatt att cacheminnet är tomt från 
början, bestäm för varje instruktion nedan om det blir en cacheträff eller en cachemiss. 
Du kan också anta att instruktionerna sker sekventiellt och att data som läggs till i en 
uppgift finns kvar till nästa. (4p) 

1 movia r8, OxBEDA 12C4 

2 IdwrlO, 0(r8) 

3 Idwrll, 16(r8) 

4. stwrlO, 32( r8) 

512/16=32 rader i cachen. För att adressera 0-31 behöver man 5 st bitar till radadressen. Man 
behöver 4 bitar för att kunna adressera 16 bytes. Av 32 bitar har man då kvar 32-5-4=23 bitar 
som hör till tagen. 

Instruktion 2: Idw rlO, 0(r8) 

0xBEDA12C4 + Oio = 0xBEDA12C4: adress i primärminnet. 

0x2C4 = 001101100101002, vilket ger rad 12io i cacheminnet, det kommer att bli en cachemiss då 
cachen från början ärtom. 

0xBEDA12C4 + 0Fi6= 0xBEDA12D3: sista adressen i primärminnet som läggs in i cacheminnet. 
Man lägger in det som finns på adress 0xBEDA12C4 - 0xBEDA12D3 i primärminnet på rad 12ioi 
cacheminnet. 

Instruktion 3: Idw rll, 16(r8) 

0xBEDA12C4 + 10i6 = 0xBEDA12D4: adressen i primärminnet. 

0x2D4 = 0011011011OIOO 2 , vilket ger rad 13io i cacheminnet. Det kommer också att bli en 
cachemiss då rad 13 i cacheminnet är tomt. 

0xBEDA12D4 + OF 16 = 0xBEDA12E3: sista adressen i primärminnet som läggs in i cacheminnet. 
Man lägger in det som finns på adress 0xBEDA12D4 - 0xBEDA12E3 i primärminnet på rad 13ioi 
cacheminnet. 

Instruktion 4: stw rlO, 32(r8) 

0xBEDA12C4 + 20i6 = 0xBEDA12E4: adressen i primärminnet. 

0x2E4 = 0011011101OIOO 2 , vilket ger rad 14io i cacheminnet. Det kommer att bli en cachemiss då 
cachen ärtom på rad 14. 

0xBEDA12E4 + OF 16 = 0xBEDA12F3: sista adressen i primärminnet som läggs in i cacheminnet. 
Man lägger in det som finns på adress 0xBEDA12E4 - 0xBEDA12F3 i primärminnet på rad 14ioi 
cacheminnet. 



